Zoek in element

Door de wereldwijde data management community (dama.org) is in de afgelopen jaren een model ontwikkeld in de Data Management Body of Knowledge (DMBoK). Dit is een praktisch uitgewerkt raamwerk met elf kennisgebieden. Hieronder een visuele representatie van het raamwerk en een korte definitie van ieder kennisgebied.  
  • Data Governance: Is het uitvoeren van controle en beheer omtrent het beheer van data assets. Data Goverance stuurt alle andere dataprocessen
  • Data architectuur: Managen, ontwikkelen en beheren van de requirements en principes rond data
  • Data modelleren: Is het ontdekken, analyseren en beschrijven van data requirements in de vorm van gestandaardiseerde modellen die een data structuur beschrijven
  • Data storage en operations: Ontwerp en implementatie van data opslag en -persistentie
  • Data security: Activiteiten rond de bescherming van informatie en data door autorisatie, authenticatie, toegang, auditing
  • Data integratie en interoperabiliteit: Managen van het transport en consolidatie van data tussen informatiesystemen en organisaties
  • Document- en content management: Managen en (levensloop)beheer van alle soorten data inclusief documenten en content
  • Reference en Master Data: Managen van generieke en algemene (herbruikbare) data en referentie data (codelijsten e.d.)
  • Datawarehousing en BI: Planning, ontwikkeling en beheer van activiteiten voor het samenstellen van data ter ondersteuning van besluitvorming en kenniswerkers
  • Meta Data: Managen, ontwikkelen en beheren van metadata.
  • Data kwaliteit: Activiteiten voor kwaliteitsmanagement van data assets zodat het geschikt is voor gebruik en voldoet aan de wensen van de data consumenten
In het DMBoK is meta data een separaat kennisgebied en is in detail uitgewerkt. Hiermee kunnen we de verschillende data entiteiten binnen een organisatie in de context van de afzonderlijke data management kennisgebieden plaatsen.

Architectuur, tooling en geautomatiseerde meta model harvesting bepalen

Meta data wordt ingebed in een complexe inrichting van verschillende informatiesystemen en tools. Enerzijds als data producent en als consument en als meta data register. Rond dit register zal data integratie tussen, producent- en consumentsystemen noodzakelijk zijn omdat het up to date houden van de meta data zonder deze data integratie zeer arbeidsintensief en tijdrovend zal zijn. Daarnaast dient de meta data aanwezig in het meta data register op interactieve wijze beschikbaar gesteld te worden aan de vele betrokkenen rond het werkveld meta data via een (web)userinterface. Gezien de complexiteit van bovenstaande inrichting is een solution architectuur hierbij een randvoorwaarde.

Bepaal integratie architectuur referentie data

Referentie data wordt op eenplek beheerd maar op veel plekken gebruikt cq geconsumeerd. Dat vraagt meerdere vormen van data integratie voor zowel de data producenten en consumenten van referentie data. Veelal zal daarom een referentie data integratie architectuur nodig zijn.

Beperk replica's

Beperken van replica’s brengt met zich mee dat de kans op verschillende inhoud van datasets kleiner wordt. Zeker de situaties waarbij replica’s veranderd en verrijkt worden tijdens de data integratie zijn veroorzakers van inconsistentie en moeten daardoor ontmoedigd worden.

Bronsysteem overstijgende sleutels

Applicatie of organisatie overstijgende sleutels, bij data integratie kan een sleutel vanuit een bronsysteem onvoldoende uniek zijn. Zeker in het geval waar bijvoorbeeld gegevensset gecombineerd worden met andere sets kunnen aanvullende maatregelen noodzakelijk zijn. In die gevallen kan het benoemen van sleutels met voldoende uniekheid vanuit architectuur of de eigenaar van gegevenssets noodzakelijk zijn. Denk bijvoorbeeld aan het BSN en KvK nummer als organisatie overstijgende sleutel.

Communiceren data model

Communiceren en publiceren van de data modellen met een bepaalde scope ten behoeve van de verschillende stakeholders en doelen van het datamodel. Dit veelal in relatie tot het domein waarvoor de modellen gecommuniceerd worden zoals het DWH, Applicatielandschap of data integratie.

Data integratie

Managen van het transport en consolidatie van data tussen informatiesystemen en organisaties.

Data Integratie

Managen van het transport en consolidatie van data tussen informatiesystemen en organisaties.

Data integratie maatregelen

Fysiek datamodel

Fysiek datamodel zowel van de berichtdefinities binnen data integratie. Daarnaast de datamodellen van de diverse administratieve toepassingen én het data model van het datawarehouse.

Introduceer sleutelkast patronen

Inzet sleutelkasten, in een aantal gevallen kunnen bij de data integratie de gegevens van een gegevensset verrijkt worden met verwijzingen naar referentiele sleutels zoals die toegepast worden op andere plaatsen binnen de organisatie. Hiermee kan dan op eenvoudige wijze herleidt worden welke identificerende sleutel waar toegepast kan worden. Sleutelkasten worden veelal beschreven binnen de architectuur in samenspraak met de eigenaren van de verschillende registers.

Introduceer werkwijze met gegevens leverings contract

Inzet servicecontract of gegevensleveringsovereenkomst. Deze documenten met afspraken kunnen redelijkheid formaliseren en op deze wijze een bijdrage leveren aan een realistische uitwerking van vraag en aanbod op diverse aspecten van redelijkheid bij data integratie. Denk hierbij aan de uitwerking van bijvoorbeeld tijdigheid, actualiteit, consistentie en validiteit Om redelijkheid te ondersteunen is het van belang dat voor de belangrijkste gebruiksgevallen beschreven is wat de redelijkheidsgrenzen dienen te zijn. Dit houdt in dat aangegeven wordt in welke situatie de kwaliteiten dermate laag zijn dat redelijkheid niet meer geldend is.

Inzet BIVP classificatie

Inrichten dataclassificatie, slechts voor een beperkt aantal typen gegevenssets speelt privacy een rol. Denk bijvoorbeeld aan persoonsgegevens of gegevens over financiën, opsporing en handhaving. In alle andere gevallen zijn bij integratie privacy aspecten van minder belang. In die situatie kan volstaan worden met minder maatregelen voor de beveiliging. Door in kaart te brengen voor welke data objecten privacy relevant is kan eenvoudig bepaald worden in welke projecten met data integratie aanvullende maatregelen nodig zijn.

Inzet datamodellen

Beschrijving van data objecten en – attributen. Door een gedetailleerde en gestructureerde beschrijving te maken van data objecten die ingezet worden voor data integratie wordt het mogelijk om op basis van deze beschrijving validaties te ontwikkelen en deze te implementeren in bovengenoemde validatie componenten.

Master Data Modelling en Meta Modelling

Data modellering en meta modellering voor voorbeeldmodellen op basis van UBL en overheidsmodellen. Deze modellen worden gebruikt voor de opslag van de data maar ook voor de data integratie, - transformatie en - validatie

Meta data (geautomatiseerd) verzameld en beheerd

Meta data heeft een complexe structuur en wordt geproduceerd en beheerd binnen een veelheid binnen de organisatie aanwezige informatiesystemen. Bijvoorbeeld in CMDB, data warehouses, data integratie platformen, tools voor data warehousing en data integratie en project management en agile ondersteunende tooling. Verzamelen van deze data in de meta data inrichting vanuit deze verschillende informatiesystemen, beheren en onderhouden van deze data en het ontsluiten van data via API's is daarmee een belangrijk onderdeel van meta data. Gezien de hoeveelheid aan data en de complexiteit van de data is een geautomatiseerde uitwisseling daarmee een noodzakelijk aspect van meta data.

Nemen van beveiligingsmaatregelen zoals encryptie en authenticatie van verzender en ontvanger

Gebruik van beveiligingsmaatregelen binnen de data integratie om zorg te dragen voor de beveiligde uitwisseling van data in berichtenverkeer tussen informatiesystemen en organisaties.

Precisie bij data integratie

Keuze en inzet integratietechnologie, hierbij moet rekening gehouden worden met de gewenste- en realiseerbare precisie. Dat kan tot gevolg hebben dat een integratievorm ongeschikt is voor een specifieke implementatie. Houdt hierbij ook rekening met het feit dat structuren op basis van de precisie opnieuw opgebouwd moeten kunnen worden, bijvoorbeeld bij het verwerken van object georiënteerde datastructuren.

Redelijkheid infrastructuur

Infrastructurele inrichting, data integratie stelt bij een aantal integratievormen hoge eisen aan de infrastructurele inrichting. Bijvoorbeeld op het vlak van performance, beschikbaarheid en capaciteit. Bij de infrastructurele inrichting dient rekening gehouden te worden met de eisen die vanuit de redelijkheid gesteld worden. Dit brengt een bepaalde configuratie met zich mee per integratievorm. Daarnaast kan de inzet van specifieke componenten noodzakelijk zijn.

Referentie Data

Referentie data is voornamelijk data voor het bepalen van domeinen voor één of meerdere attributen bij een logische data entiteit. Door het gebruik van deze domeinen ontstaat een gezamenlijke gestandaarde visie op de domeinen van deze data. Deze referentie data is met name van belang bij Data Integratie, BI en DWH maar ook bij ontwikkelen en inrichten van software ter ondersteuning van alle werkprocessen in de organisatie. Omdat de referentie data gekoppeld is aan het single point of maintenance paradigma is met name data integratie een uitdaging inclusief de bijbehorende integratievormen en requirements. Daarnaast zie je een deel van de referentie data entiteiten niet in de eigen organisatie beheerd worden. Bijvoorbeeld internationale instanties zoals bijvoorbeeld ISO maar ook sectorale of overheids referentie data kan geintroduceerd worden binnen de eigen referentie data. Als laatste is de complexiteit voor data governance, data modellering, data kwaliteiten en data architectuur te noemen. Vanwege het generieke karakter van deze referentie data vraagt dit een bijzondere uitwerking. Daarom wordt er voor referentie data veelal een Plan van Aanpak en een solution architectuur uitgewerkt.

Referentiele integriteit bij data integratie

Inrichten integratievorm, bij verschillende vormen van integratievormen kan de wijze van inrichting een negatief effect hebben op de referentiele integriteit. Bijvoorbeeld bij integratie op basis van berichten kunnen aanvullende eisen gesteld worden aan de in te zetten componenten, verbindingen en protocollen. Bij de inzet van generieke integratievoorziening dient rekening gehouden te werken met de strengste eisen van integriteit zoals deze binnen deze voorziening ingezet zal worden. De technische voorzieningen moeten voldoende oplossingen te hebben voor het handhaven van referentiele integriteit. Denk bijvoorbeeld aan voorzieningen als het genereren van unieke sleutels het werken met transacties en rollback mechanismen. Met name in een sterk gedistribueerde omgeving zoals een SOA omgeving is dit een uitdaging.

Technische metadata

Metadata afkomstig uit technische systemen. Denk hierbij bijvoorbeeld databases, logs, data integratie technische data, data transformatie toepassingen en infrastructurele systemen.

Tijdigheid specificatie in service contract

Inzet servicecontract of gegevensleveringsovereenkomst. Deze documenten met afspraken kunnen tijdigheid als verbijzondering van redelijkheid formaliseren en op deze wijze een bijdrage leveren aan een realistische uitwerking van vraag en aanbod op aspecten van tijdigheid bij data integratie. Gebruiksafspraken maken met gebruikers en beheerders om zo voor een betere verdeling van het gebruik te bereiken (zie ook redelijkheid), bijvoorbeeld door contractafspraken te maken omtrent het gegevensgebruik en het uitvoeren van beheeractiviteiten.

Werk beschrijving en kaders uit voor domein

Werk de beschrijving en de kaders uit voor de verschillende data management kennisgebieden binnen het domein. Essentieel voor deze uitwerking zijn Data Kwaliteiten, Data Modelleren en Meta Data. Desgewenst kunnen andere kennisgebieden zoals Data Integratie, Master en Reference Data, Data Ware Housing en Data Operations.

Links 2 Tags